บทนำสู่การสร้างแบบจำลองเชิงสร้างสรรค์: ก้าวข้ามการแยกแยะ

เรากำลังเปลี่ยนจาก การสร้างแบบจำลองเชิงแยกแยะ, ซึ่งแก้ปัญหาการจัดประเภทและถดถอยโดยเรียนรู้ความน่าจะเป็นเงื่อนไข $P(y|x)$ ไปสู่โดเมนที่ซับซ้อนของ การสร้างแบบจำลองเชิงสร้างสรรค์. เป้าหมายหลักของเราตอนนี้เปลี่ยนไปเป็น การประมาณความหนาแน่น: การเรียนรู้การแจกแจงข้อมูลพื้นฐานทั้งหมด $P(x)$ โดยตรง ความเปลี่ยนแปลงพื้นฐานนี้ช่วยให้เราจับภาพความสัมพันธ์ที่ละเอียดอ่อนและโครงสร้างซับซ้อนในชุดข้อมูลที่มีมิติสูงได้ ข้ามการแบ่งแยกเพียงเส้นขอบไปสู่การเข้าใจข้อมูลอย่างแท้จริงและการสร้างข้อมูลใหม่

1. เป้าหมายการสร้างแบบจำลอง: การสร้างแบบจำลอง $P(x)$

เป้าหมายของแบบจำลองการสร้างคือการประมาณการแจกแจงความน่าจะเป็น $P(x)$ จากข้อมูลฝึกสอน $X$ ที่มาจากการแจกแจงนั้นเอง แบบจำลองการสร้างที่ประสบความสำเร็จสามารถทำสามงานสำคัญได้: (1) การประมาณความหนาแน่น (กำหนดคะแนนความน่าจะเป็นให้กับข้อมูลเข้า $x$), (2) การสุ่มตัวอย่าง (สร้างจุดข้อมูลใหม่ทั้งหมด $x_{new} \sim P(x)$), และ (3) การเรียนรู้ลักษณะโดยไม่มีการระบุ (ค้นพบการแสดงผลที่มีความหมายและแยกออกจากกันในพื้นที่ซ่อนเร้น)

2. ระบบจำแนกประเภท: ความน่าจะเป็นชัดเจนเทียบกับความน่าจะเป็นแฝง

แบบจำลองการสร้างถูกจำแนกพื้นฐานตามแนวทางที่ใช้ต่อฟังก์ชันความน่าจะเป็นแบบจำลองความหนาแน่นชัดเจน, เช่น เครื่องอัตโนมัติแบบแปรผัน (VAEs)และแบบจำลองการไหล กำหนดฟังก์ชันความน่าจะเป็นทางคณิตศาสตร์ และพยายามเพิ่มค่าความน่าจะเป็นนั้น (หรือค่าต่ำสุดของมัน)แบบจำลองความหนาแน่นแฝง, ที่มีชื่อเสียงที่สุดคือ เครือข่ายการสร้างขัดแย้ง (GANs), ข้ามการคำนวณความน่าจะเป็นทั้งหมด แทนที่จะเรียนรู้ฟังก์ชันการแมปเพื่อสุ่มจากแจกแจง $P(x)$ โดยใช้กรอบการฝึกแบบขัดแย้ง

การสร้างข้อมูลและการแทรกแซงลักษณะ

แบบจำลองการสร้างแสดงศักยภาพของตนโดยการสร้างตัวอย่างใหม่ที่มีคุณภาพสูง (ตัวอย่างเช่น ใบหน้าที่ไม่เคยเห็นมาก่อน หรือพื้นผิวซับซ้อน) หรือโดยการอนุญาตให้เกิดการแทรกแซงเชิงความหมายในพื้นที่ซ่อนเร้นที่เรียนรู้ไว้ แสดงให้เห็นถึงความเข้าใจของโมเดลต่อความหลากหลายของข้อมูล

Examples of AI-generated faces and interpolated features.

คำถามที่ 1

ในการสร้างแบบจำลองเชิงสร้างสรรค์ แจกแจงหลักที่สนใจคืออะไร?

$P(x)$

$P(y|x)$

$P(x|y)$

$P(y)$

คำถามที่ 2

แบบจำลองการสร้างชนิดใดที่อาศัยการฝึกแบบขัดแย้ง และหลีกเลี่ยงการกำหนดฟังก์ชันความน่าจะเป็นที่ชัดเจน?

เครื่องอัตโนมัติแบบแปรผัน (VAE)

แบบจำลองออโตเรเกรสซีฟ

เครือข่ายการสร้างขัดแย้ง (GAN)

แบบจำลองผสมเกาส์เซียน (GMM)

ภารกิจท้าทาย: การตรวจจับความผิดปกติ

ใช้ประโยชน์จากกระบวนการประมาณความหนาแน่น

สถาบันการเงินได้ฝึกแบบจำลองการสร้างความหนาแน่นชัดเจน $G$ บนบันทึกการทำธุรกรรมที่ถูกต้องหลายล้านรายการ แล้วธุรกรรมใหม่ $x_{new}$ เข้ามา

เป้าหมาย: ตรวจสอบว่า $x_{new}$ เป็นความผิดปกติ (การฉ้อโกง) หรือไม่

ขั้นตอนที่ 1

จากผลการประมาณความหนาแน่นของ $P(x)$ ตัววัดทางสถิติใดที่ต้องประเมินสำหรับ $x_{new}$ เพื่อระบุว่าเป็นความผิดปกติ?

คำตอบ:
โมเดลต้องประเมินความน่าจะเป็น (หรือความน่าจะเป็น) $P(x_{new})$ หาก $P(x_{new})$ ต่ำกว่าค่าเกณฑ์ที่กำหนดไว้ $\tau$ หมายความว่าจุดใหม่นี้มีความน่าจะเป็นทางสถิติต่ำเมื่อเทียบกับการแจกแจงที่เรียนรู้จากธุรกรรมปกติ มันจึงถูกตั้งเป็นความผิดปกติ